Observations & variables

Quantitative Methodology (UPF)

Jordi Mas Elias

https://www.jordimas.cat/

Summary

  • Terminology
  • Tidy data
  • Pivoting
  • Observations
  • Variables

Terminology

Table

Can be almost anything. Qualsevol cosa: Taula periòdica, taula de multiplicar, taula de la veritat, taula de chi quadrat,

Dataframe

Una manera d’emmagatzemar dades d’R Normalment les emmagatzemarem tidy.

Spreadsheet

Com Excel emmagatzema les dades.

Observations

What is an observation?

The thing that we want to know about.

  • Unit of analysis:
  • Unit of observation:

Examples:

  • States
  • Bombings
  • Ethnic groups
  • Terrorist rups ètnics, atemptats terroristes.

Types of dataset:

  • Monàdiques
  • Diàdiques.

Problema unitat d’anàlisi:

  • Singer
  • Fal·làcia ecològica: “Els rics són menys corruptes”.

Variables

What is a variable?

Tipus de variables i recodificacions. - Tipus de variables. - NA: estats i capacitat burocràtica. - Recodificacions.

Tidy data

Wickham rules

We consider a dataframe as tidy if it fulfills the following requirements (Wickham 2014):

  • Each dataframe has one unit of observation.
  • Observations are represented in the rows.
  • Variables are represented in the columns.
  • Each cell indicates a value.

Pivoting dataframes

What does it mean?

Canviem la unitat d’anàlisi, les observacions, i les variables del marc de dades, mantenint la mateixa informació.

  • Pivot longer
  • Pivot wider

Pivot longer

Pivot wider

Wickham, Hadley. 2014. Tidy Data.” Journal of Statistical Software 50 (10): 1–23.